Marginalia — Cuaderno Interactivo Excursus — Galton y el origen de la regresión a la mediocridad

Table of Contents

Notas de lectura sobre el trabajo original de Francis Galton \citep{galton1886} que dio origen al término "regresión". Esta pieza nace al leer la sección "Historical Origins" del capítulo 1 de \citet{kutner2004} — ver ← volver a las notas del capítulo 1.

Por qué este excursus existe aparte

Kutner dedica un párrafo al origen histórico del término "regresión". Profundizar en el texto original de Galton resultó en mucho más material del que tiene sentido mezclar dentro de las notas de un manual de estadística aplicada — así que vive acá, como pieza propia, citable y enlazada desde el capítulo 1.

El hallazgo original: experimentos con semillas (1877)

Motivación y contexto

Galton no comenzó con la altura humana, sino con semillas de guisantes (sweet peas). Su objetivo era demostrar una "ley simple y de gran alcance" que gobierna la transmisión hereditaria de cualidades simples.

"It appeared from these experiments that the offspring did not tend to resemble their parent seeds in size, but to be always more mediocre than they — to be smaller than the parents, if the parents were large; to be larger than the parents, if the parents were very small."

Aquí nace el concepto de regresión hacia la mediocridad. Galton observa que la descendencia extrema (muy grande o muy pequeña) tiende a acercarse al promedio de la población, no a mantenerse en el extremo de los padres. El punto de convergencia no es la media de los padres seleccionados, sino la media de una población "autoplantada" (no seleccionada).

Proporcionalidad de la regresión

"The experiments showed further that the mean filial regression towards mediocrity was directly proportional to the parental deviation from it."

La base de esta conclusión fueron plantaciones extensas realizadas por amigos en todo el Reino Unido (desde Nairn hasta Cornwall) durante 1, 2 o 3 generaciones. En esta etapa (1877–1886) Galton admite que el "ratio exacto de regresión" era "un poco dudoso" debido a influencias variables, por lo que no intentó definirlo numéricamente todavía.

Transición a la evidencia antropológica

"After the lecture had been published, it occurred to me that the grounds of my misgivings might be urged as objections to the general conclusions… I was then blind to what I now perceive to be the simple explanation of the phenomenon…"

Galton buscó evidencia independiente en humanos para confirmar la ley. Inicialmente falló en obtener datos suficientes, lo que lo llevó a ofrecer premios por "Family Records" (registros familiares), asegurándose de no revelar el objetivo específico para evitar sesgos ("lest a bias should be given to the returns").

Esta etapa establece la hipótesis central: la herencia no es una copia exacta, sino un proceso de "dilución" hacia la media poblacional. Las semillas probaron el fenómeno, pero Galton necesitaba datos humanos para cuantificar la ley con precisión.

Conceptos clave

  • Mediocridad (mediocrity): sin connotación negativa — se refiere estrictamente a la media aritmética de la población.
  • Desviación parental: la diferencia entre la altura del padre (o semillas) y la media.
  • Proporcionalidad: la cantidad de regresión es una fracción constante de la desviación original.

El conjunto de datos humanos

Metodología y muestra

Galton describe el proceso de recolección de datos para evitar cualquier sesgo en las respuestas:

"I especially guarded myself against making any allusion to this particular inquiry in my prospectus, lest a bias should be given to the returns."

  • Muestra: 930 hijos adultos y sus respectivos parentales (205 parejas).
  • Criterio de selección: estatura.
  • Ofreció premios por "Family Records"; la respuesta fue amplia. Galton justifica que, aunque los registros de altura podrían ser inexactos por descuido, la concordancia de los resultados en diferentes grupos de datos confirma la validez del fenómeno.

Primer resultado numérico

"It gives the numerical value of the regression towards mediocrity in the case of human stature, as from 1 to 2 with unexpected coherence and precision [see Plate IX, fig. (a)]…"

"1 to 2" se refiere a la relación entre la desviación de los padres y la de los hijos: si la desviación parental es 2 unidades, la regresión de los hijos es de 1 unidad (pendiente = 1/2 = 0.5). Más adelante Galton refina este cálculo a 2/3 (≈0.67) — la cifra que termina siendo canónica en el resto del texto.

El ajuste de género: factor 1.08

"In every case I transmuted the female statures to their corresponding male equivalents and used them in their transmuted form, so that no objection grounded on the sexual difference of stature need be raised when I speak of averages."

Factor aplicado: 1.08 (equivalente a sumar un poco menos de 1/12 a cada altura femenina). Es ligeramente distinto al de otros antropólogos (1.07 o 1.09), pero Galton argumenta que sus datos se ajustan mejor a él. Admite que incluso usando un factor ligeramente diferente, "the result came out closely the same" — el resultado es robusto a la elección exacta del factor.

Conceptos clave

  • Transmutación (transmutation): proceso de convertir una variable (altura femenina) a una escala comparable (equivalente masculino) mediante un factor multiplicativo.
  • Regresión 1 a 2: la proporción inicial observada, antes del refinamiento a 2/3.

La tabla I: datos brutos de regresión (p. 248)

Estructura

Matriz de contingencia (histograma 2D) con la frecuencia de hijos según la estatura de sus padres y la suya propia.

  • Filas: estatura de los padres medios (mid-parents) en pulgadas, desde "below 62.2" hasta "above 72.5", en intervalos de 1 pulgada.
  • Columnas: estatura de los hijos adultos, mismo rango.
  • Celdas: número de hijos en la intersección de una altura de padre y una de hijo.
  • Filas y columnas de totales muestran la distribución marginal; cada fila y columna incluye una mediana calculada.

El sesgo de redondeo y la elección de intervalos

"In calculating the Medians, the entries have been taken as referring to the middle of the space in which they stand. The reason why the headings run 62.2, 63.2, &c., instead of 62.5, 63.5, &c., is that the heights are not equally distributed between 62 and 63, 63 and 64, &c., there being a strong bias in favour of integers."

Galton notó que la gente tiende a reportar su estatura en números enteros, creando una distribución sesgada. En lugar de intervalos simétricos (62.5, 63.5) usó 62.2, 63.2, 64.2 — ajustando los límites de clase para acomodar el sesgo y obtener medianas más precisas.

La regresión, visible en la tabla

  1. Padres extremos (muy bajos, fila "below 62.2"): la mediana de los hijos sube a 66.3 pulgadas, acercándose a la media general.
  2. Padres extremos (muy altos, fila "above 72.5"): la mediana de los hijos baja a 69.7 pulgadas, también acercándose a la media.
  3. El patrón: las medianas de las filas disminuyen a medida que aumenta la altura de los padres — la manifestación numérica de la línea de regresión.

Conceptos clave

  • Mid-parents (padres medios): promedio aritmético de la estatura del padre y la madre (ajustada por el factor 1.08). Es la variable independiente en el análisis de Galton.
  • Sesgo de enteros: la tendencia humana de reportar números redondos.
  • Distribución marginal: los totales de filas/columnas.

Visualización: Plate IX, Fig. (a) (p. 248 cont.)

El gráfico fundamental

Primera representación visual de la regresión a la media en la historia de la estadística.

  • Eje X: estatura de los padres medios, 65–72 pulgadas. El "0" del eje de desviaciones corresponde a la altura media de la población (68.5 pulgadas).
  • Eje Y: desviación de la estatura de los hijos respecto a la media, en pulgadas (+1, +2, +3…).
  • Cada punto representa la altura media de los hijos para un grupo específico de padres de esa altura.

La pendiente clave

"The Deviates of the Children are to those of their Mid-Parents as 2 to 3."

2:3 ⟹ pendiente de la línea de regresión = 2/3 (≈0.67). Si los padres tienen desviación +3 pulgadas, los hijos tienden a +2; si los padres tienen -3, los hijos tienden a -2. Los hijos regresan hacia la media poblacional.

Simetría

Caso Texto del gráfico Posición de la línea
Padres más altos que la media "When Mid-Parents are taller than mediocrity, their Children tend to be shorter than they." Por debajo de la línea de "perfecta herencia" (pendiente 1)
Padres más bajos que la media "When Mid-Parents are shorter than mediocrity, their Children tend to be taller than they." Por encima de la línea de perfecta herencia

A la izquierda del gráfico principal hay un diagrama circular ("Forecast of Stature") que ilustra cómo usar la regresión para predecir la estatura de un hijo a partir del mid-parent.

Conceptos clave

  • Desviación (deviate): diferencia entre un valor individual y la media de la población — término técnico que Galton acuña en la sección 1.2.8 de este excursus.
  • Línea de perfecta herencia: línea hipotética de pendiente 1, donde los hijos tendrían exactamente la misma desviación que sus padres. Galton demuestra que la realidad es distinta.

Material gráfico original

galton-plate-ix-fig-a.png

La placa IX, figura (a): demostración visual de Galton de la regresión a la mediocridad.

galton-table-i-data.png

Datos de alturas y desviaciones para padres medios e hijos adultos usados en el diagrama anterior (Tabla I, Plate X).

Por qué la estatura: fundamentos teóricos (p. 249)

Ventajas prácticas de la variable "estatura"

Galton argumenta que la estatura es superior a otras medidas corporales:

  • Medición frecuente y fácil, con alta precisión y repetición.
  • Constancia durante "thirty-five years of middle life" — a diferencia del peso o la musculatura.
  • Poca dependencia de diferencias de crianza o nutrición.
  • No influye significativamente en la tasa de mortalidad, evitando sesgos en la muestra de supervivientes.

La naturaleza compuesta de la estatura

"stature is not a simple element, but a sum of the accumulated lengths or thicknesses of more than a hundred bodily parts…"

La estatura es la suma acumulada de más de un centenar de partes corporales: ~50 huesos, cartílagos intervertebrales, tejidos blandos, factores de forma. Al ser suma de tantos elementos independientes, la estatura sigue la ley de los grandes números casi perfectamente — la variabilidad de cada hueso se promedia, resultando en una curva de distribución suave y regular.

Galton menciona el esqueleto del gigante O'Brien (7 pies 7 pulgadas): podría haber sido aún más alto si sus vértebras dorsales hubieran sido más paralelas — ilustrando que la estatura final es la suma de cientos de pequeñas dimensiones.

El axioma del promedio parental

"the stature of the children depends closely on the average stature of the two parents, and may be considered in practice as having nothing to do with their individual heights."

Dado que la altura es la suma de muchos elementos (heredados de ambos padres), al promediarlos se obtiene una "estatura parental media" que actúa como punto de referencia estable. La variación individual de un solo progenitor se diluye en la suma de tantos elementos.

Metodología de validación (Tabla II)

  1. Transmutación: ajustar alturas femeninas (×1.08).
  2. Agrupación: clasificar padres según su diferencia de altura.
  3. Selección: solo familias con 6+ hijos, para que el promedio fuera estadísticamente confiable.
  4. Resultado: las desviaciones de los hijos respecto al promedio familiar mostraron una regularidad que confirma que la herencia opera sobre el promedio parental, no sobre individuos aislados.

La irrelevancia de la discrepancia parental: Tabla II (p. 250)

La "tendencia fina" y por qué se ignora

"…in the last of them the children showed a faint tendency to fall into two sets, one taking after the tall parent, the other after the short one."

Cuando los padres difieren mucho en estatura, los hijos tienden a dividirse en dos grupos sutiles. Esta tendencia es tan débil que no es visible en la Tabla II resumida, así que Galton la ignora para el propósito de estudiar la herencia general.

Estructura y resultado de la Tabla II

  • Filas: diferencia de altura entre los padres (de "menos de 1 pulgada" a "5 pulgadas o más").
  • Columnas: proporción de hijos que se desvían de la altura promedio familiar en 1, 2, 3… pulgadas.

Las columnas de porcentajes (21, 35, 43… hasta 50) son extremadamente consistentes a través de todas las filas — casi idénticas sin importar la diferencia parental.

"It is therefore certain that differences in the heights of the parents have on the whole an inconsiderable effect on the heights of their offspring."

El concepto de "mid-parent"

"The average height of the two parents, or, as I prefer to call it, the 'mid-parental' height, is all we need care to know about them."

Esto simplifica el problema de la herencia de dos variables (padre y madre) a una sola variable: el promedio.

Notas metodológicas adicionales

  • Transmutación femenina: cada altura femenina ×1.08.
  • Selección de muestra: solo familias con 6+ hijos adultos, para reducir el error de muestreo del promedio filial.
  • Uso abstracto de "parent": estadísticamente, los casos de padre alto con madre baja se equilibran con los de padre bajo con madre alta. Galton reconoce un hecho interesante (la hija se parece más al padre que a la madre) pero deja esto para investigaciones futuras por falta de datos suficientes.

La ausencia de selección por estatura en el matrimonio (p. 251)

El argumento: el matrimonio es aleatorio respecto a la altura

"…marriage choice is guided by so many and more important considerations that questions of stature appears to exert no perceptible influence upon it."

"…we may therefore regard the married folk as couples picked out of the general population at haphazard."

Esto permite aplicar la ley de probabilidades asumiendo que los padres no se emparejaron por su altura.

Evidencia empírica: Tabla III (205 parejas)

Clasificación en tres grupos por sexo: T (tall, 70"+), M (medium, 67"–70"), S (short, <67").

Tipo de pareja Combinaciones Total
Contrastadas (alto + bajo) S,t (12) + T,s (14) 32
Similares (alto+alto / bajo+bajo) S,s (9) + T,t (18) 27

"men and women of contrasted heights… married just about as frequently as men and women of similar heights… there were 32 cases of the one to 27 of the other."

32 y 27 son suficientemente cercanos (sobre una muestra de 205) como para concluir que no hay preferencia significativa — ni asortatividad ni disortatividad marcada por la altura.

Resumen de las ventajas de la estatura como variable

  1. Constancia en la vida adulta.
  2. Medición frecuente.
  3. Independencia del entorno de crianza.
  4. Independencia de la supervivencia diferencial.
  5. Independencia de la selección de pareja (Tabla III).
  6. Simplificación a un solo "mid-parent".
  7. Regularidad estadística casi perfecta (ley de error / curva normal).

Validación cruzada de la variabilidad

Si la estatura sigue la ley de error y los padres se emparejan al azar, la variabilidad de los mid-parents debe ser exactamente la variabilidad de los hombres adultos multiplicada por \(\sqrt{2}\). Galton confirma esto por observación directa — prueba de que su modelo (promedio de dos variables aleatorias independientes) es correcto.

La ley de regresión y su justificación teórica (p. 252)

Limitaciones honestas de los datos

La estatura varía poco en la población (la mitad varía menos de 1.5 pulgadas), y la precisión de medición es baja:

"…each observation… is liable to an error that as often as not exceeds 2/10 of an inch."

El "ruido" en los datos es significativo, lo que hace el patrón descubierto (la regresión) aún más notable.

El concepto de "deviate"

En lugar de medir desde el suelo, Galton mide desde la mediana de la especie ("crown to the level of mediocrity"), fijada en 68.2 pulgadas.

"…we may include both under the single head of deviations, and I shall call any particular deviation a 'deviate'."

Esto permite tratar la estatura alta y baja como un solo fenómeno matemático (desviación), simplificando el modelo.

La fórmula de la ley

"It is that the height-deviate of the offspring is, on the average, two-thirds of the height-deviate of its mid-parentage."

La desviación de los hijos es, en promedio, dos tercios de la desviación de sus padres medios. Si los padres tienen desviación +3 pulgadas, los hijos tendrán en promedio \(3 \times \frac{2}{3} = 2\) pulgadas. Los hijos nunca alcanzan el extremo de sus padres; siempre regresan hacia la media.

Justificación causal: ¿por qué existe la regresión?

Herencia mixta: el hijo hereda de toda su ascendencia, no solo de los padres inmediatos.

"The child inherits partly from his parents, partly from his ancestry."

Dilución de la varianza ancestral: cuanto más atrás en el árbol genealógico, más numerosos y variados son los antepasados, hasta convertirse en una muestra aleatoria de la población general — cuya altura promedio es, por definición, la media poblacional.

Fórmula conceptual: el hijo es un promedio entre la desviación de los padres y la desviación cero de la masa ancestral. Si los padres son extremos, la masa ancestral "promedio" diluye esa extremidad.

"…we ought to expect filial regression, and that it should amount to some constant fractional part of the value of the mid-parental deviation."

Esta explicación biológica transforma la observación estadística en una ley natural: la regresión no es un error de los datos, sino una propiedad necesaria de la herencia en una población estable.

La mecánica de la regresión: dilución y el "generante" (p. 253)

La analogía del vino y el agua

  • El mid-parent es el "vino" (concentración de una característica extrema).
  • Los antepasados remotos son el "agua pura" (promedio poblacional, desviación cero).
  • Combinar el padre con los antepasados remotos diluye la "fuerza" de la desviación en una fracción constante, sin importar cuán extremo era el padre.
  • Las generaciones intermedias no son agua pura, sino mezcla — pero su efecto combinado es solo una dilución proporcional adicional.

El concepto de "generante" (the generant)

"We have no word to express the form of that ideal and composite progenitor… If he, she, or it, is styled the 'generant'…"

El generante es el progenitor ideal/promedio del grupo, del cual los hijos divergen simétricamente. Distinción crítica: los padres reales ≠ el generante. Los hijos regresan hacia el generante, no hacia sus padres reales.

El "impuesto de sucesión" de la naturaleza

"The law is even-handed; it levies the same heavy succession-tax on the transmission of badness as well as of goodness."

La transmisión de rasgos extremos (buenos o malos) está gravada por un "impuesto" — pocos hijos alcanzan el nivel de sus padres medios, y cuanto más excepcional el rasgo, más improbable que un hijo lo iguale o supere. Esto disuade tanto las expectativas exageradas sobre el genio heredado como los miedos exagerados sobre la debilidad heredada — la regresión actúa como nivelador biológico.

Advertencia sobre la asimetría (el converse)

Error lógico común: pensar que si el hijo es 2/3 del padre, el padre debe ser 3/2 del hijo. La regresión es una propiedad de la distribución condicional, no una reversión simétrica simple — la probabilidad inversa (dado un hijo con desviación +3, ¿cuál es la desviación más probable de sus padres?) depende de la distribución de la población completa, no es simplemente el inverso matemático de 2/3.

La verificación matemática: elipses de frecuencia (p. 255)

La geometría de la herencia

Todas las elipses de frecuencia (distribución de hijos para distintos grupos de padres) comparten un centro común: la intersección correspondiente a la altura media poblacional (68.2 pulgadas). Los ejes de las elipses comparten una inclinación similar, indicando una relación direccional consistente.

Confirmación por tangentes

  • Tangentes horizontales: forman una línea inclinada a la vertical en ratio 2/3 — confirma que la altura máxima probable de los hijos es 2/3 de la desviación de los padres.
  • Tangentes verticales: forman otra línea, en ratio 1/3 respecto a la horizontal, asociada por Galton a la regresión inversa.

La colaboración con J. Hamilton Dickson

Galton envía el problema —despojado de cualquier referencia biológica— a J. Hamilton Dickson (St. Peter's College, Cambridge), dándole solo tres datos de entrada: la variabilidad racial, la variabilidad intrafamiliar, y la tasa media de regresión observada.

"It is obvious, then, that the law of error holds throughout with sufficient precision to be of real service, and that the various results of my statistics are not casual and disconnected determinations, but strictly interdependent."

  • TODO Verificar la cifra "6/17" de la corrección de Dickson

    El texto fuente da la regresión observada por Galton como 2/3 (≈0.67) y dice que el cálculo de Dickson la "corrigió" a 6/17 (≈0.35). Son valores demasiado distintos como para tratarse de una "corrección menor" del mismo parámetro — algo no cuadra. Hipótesis a revisar contra el texto original de Galton (Natural Inheritance,

    1. o el paper de 1886:
    2. ¿Error de OCR/transcripción del PDF fuente?
    3. ¿"6/17" se refiere a otro parámetro (pendiente de la tangente vertical, ratio de la elipse) y no a la tasa de regresión misma?
    4. Si es así, reescribir esta sección distinguiendo explícitamente cada parámetro y su valor correcto.

    Lo que sí está claro, independientemente de esta cifra puntual: la corrección de Dickson cambió la relación entre ejes mayor y menor de la elipse en un 3%, y la inclinación en menos de 2 grados — ajustes finos, no un cambio radical de modelo.

La ecuación maestra y el equilibrio estable de la población (p. 256)

La gran paradoja

¿Cómo puede la población mantener una distribución de alturas estable, generación tras generación, si los hijos de los extremos regresan hacia la media? La respuesta: un equilibrio dinámico entre dos fuerzas opuestas que se neutralizan mutuamente.

  • Fuerza concentradora: agrupa los elementos dispersos en un sistema más compacto (la regresión hacia la media).
  • Fuerza dispersiva: toma lo compactado y lo dispersa de nuevo desde un nuevo centro (la variabilidad intrafamiliar).

Las dos etapas del ciclo

Etapa 1 — compresión: población general → emparejamiento → mid-parents (más compactos que la población) → generantes (aún más compactos, el centro ideal hacia el que regresan los hijos). Efecto: reduce la variabilidad.

Etapa 2 — expansión: cada generante actúa como nuevo centro; los hijos divergen hacia arriba y abajo desde ahí, formando la siguiente generación con la variabilidad restaurada. Efecto: aumenta la variabilidad.

La analogía del resorte

La regresión actúa como un resorte que se opone a la desviación: cuanto más extremo el rasgo, más fuerte la fuerza que lo empuja de vuelta a la media — proporcional a la desviación. Esto garantiza que la población no se desvíe indefinidamente hacia los extremos.

La ecuación

Galton unifica tres conceptos en una sola ecuación. La transcripción del texto fuente da:

\[ \frac{v^2}{p^2} + f^2 = p^2 \]

donde \(v\) es la variabilidad racial (población general), \(p\) la variabilidad de los padres medios, y \(f\) la variabilidad intrafamiliar (co-family variability). La forma más reconocible de esta misma idea, en notación moderna, es

\[ r^2 + f^2 = 1 \]

con \(r\) el coeficiente de regresión.

Nota de lectura: el texto fuente da los valores de Galton como "v=2, p=1.7, f=1.5", con cierta ambigüedad de transcripción. Lo importante conceptualmente es que los tres parámetros —variabilidad racial, tasa de regresión, variabilidad intrafamiliar— no son independientes: conocidos dos, el tercero queda determinado.

Los dos datos elementales

Toda la complejidad de la herencia se reduce a dos números: la razón de regresión, y la variabilidad co-familiar. Con solo estos dos, se puede calcular la tabla completa de alturas de padres medios y sus hijos.

El propósito declarado de la investigación

"The mean regression in stature of a population is easily ascertained; I do not see much use in knowing it, but will give the work merely as a simple example."

Galton no buscaba predecir la altura de un individuo específico, sino descubrir las leyes universales que gobiernan la herencia. La precisión numérica era un medio para demostrar la validez de la teoría general.

La Tabla IV: la prueba visual del equilibrio (p. 257)

galton-table-iv-data.png

Las cuatro etapas del flujo

Etapa Columna Descripción Efecto en la variabilidad
1. Distribución inicial Generación actual Población de padres (1000 individuos) dividida en cuartiles. Base: variabilidad completa (\(v\)).
2. Concentración Mid-parents Formación de padres medios; el emparejamiento agrupa, reduciendo los extremos. Varianza disminuye.
3. Regresión Generants Aplicación de la ley de regresión; los mid-parents se mueven hacia la media ideal. Concentración máxima.
4. Dispersión Generación siguiente Nacimiento de los hijos; actúa la variabilidad intrafamiliar. Varianza restaurada al nivel original.

La conclusión demostrada: identidad poblacional

La distribución de la Columna 1 (generación actual) y la Columna 4 (generación siguiente) son numéricamente idénticas — por ejemplo, 239 individuos en el cuartil superior en ambas. A pesar de que cada individuo "regresa" hacia la media, la población total no cambia.

"The balance from other sources is so nicely made up."

La fuerza que comprime (regresión) y la que expande (dispersión familiar) son exactamente iguales en magnitud, opuestas en dirección.

Miscelánea y conclusiones finales (p. 258)

La magnitud cuantitativa de la regresión

  • Desviación probable: 1.7 pulgadas (rango donde cae el 50% de la población).
  • Desviación media: ≈1.9 pulgadas (\(1.7 \times 1.18 \approx 1.9\)).
  • Pérdida media por regresión: ≈0.6 pulgadas (\(1.9 / 3 \approx 0.63\)) — cuánto "pierde" en promedio un hijo de la estatura excepcional de sus padres, acercándose a la media poblacional.

Estabilidad de un tipo biológico

"Una forma ideal hacia la que tienden a regresar los hijos de aquellos que se desvían de ella."

La estabilidad se mide por la fuerza de la tendencia a regresar: una regresión de 1 a 2 indica solo la mitad de la estabilidad que una regresión de 1 a 1.

Límites de la regresión y especiación

Galton especula: existen límites de desviación más allá de los cuales no hay regresión. Superado ese límite, se entra en un nuevo estado de equilibrio y nace un nuevo tipo — sugiriendo que la especiación podría ocurrir cuando una desviación es tan grande que el mecanismo de regresión deja de actuar, fijando la nueva característica.

Honestidad científica sobre la precisión

Galton describe sus números como "serviceably approximate" — útiles pero no definitivos — y solicita explícitamente que sean reinvestigados con mediciones "más abundantes y mucho más precisas". Reconoce relaciones interesantes que no pudo cuantificar por falta de material, como la influencia relativa del padre y la madre según el sexo del hijo.

Ramas no exploradas

  • Dominio continuo de un tipo sobre otros (competencia entre tipos).
  • Persistencia de características insignificantes.
  • Herencia de enfermedades (requiere modelar dos herencias simultáneas: constitución susceptible + gérmenes de la enfermedad).
  • Desviación fraterna y descendencia colateral.

Síntesis del excursus

  1. El hallazgo: la descendencia de extremos regresa hacia la media, en una proporción constante (≈2/3 para la estatura humana).
  2. La causa: la herencia mezcla a los padres con una masa ancestral que, por ley de los grandes números, es siempre "promedio" — esa masa diluye los extremos.
  3. La paradoja resuelta: la población se mantiene estable porque la fuerza concentradora (regresión) y la dispersiva (variabilidad intrafamiliar) se compensan exactamente.
  4. El legado: el término "regresión" sobrevivió mucho más allá de su contexto original sobre la estatura, para nombrar cualquier relación estadística entre variables — el uso que hace Kutner (y casi toda la estadística moderna) hoy.

Volver a las notas del capítulo 1 de Kutner.

Date: 2026-06-20 Sat 00:00

Author: Emanuel Quintana

Created: 2026-07-03 Fri 22:53

Validate